检索结果

Select

1. 基于语言模型词嵌入和注意力机制的敏感信息检测方法

黄诚, 赵倩锐

《计算机应用》唯一官方网站 2022, 42 (7): 2009-2014. DOI: 10.11772/j.issn.1001-9081.2021050877

摘要（735）

HTML （44）

PDF （973KB）（293）

针对基于关键词字符匹配和短语级情感分析等传统敏感信息检测方法准确率低和泛化性差的问题，提出了一种基于语言模型词嵌入和注意力机制（A-ELMo）的敏感信息检测方法。首先，进行字典树快速匹配，以最大限度地减少无用字符的比较，从而极大地提高查询效率；其次，构建了一个语言模型词嵌入模型（ELMo）进行语境分析，并通过动态词向量充分表征语境特征，从而实现较高的可扩展性；最后，结合注意力机制加强模型对敏感特征的识别度，从而进一步提升对敏感信息的检测率。在由多个网络数据源构成的真实数据集上进行实验，结果表明，所提敏感信息检测方法与基于短语级情感分析的方法相比，准确率提升了13.3个百分点；与基于关键字匹配的方法相比，准确率提升了43.5个百分点，充分验证了所提方法在加强敏感特征识别度、提高敏感信息检测率方面的优越性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于图卷积网络的文本分割模型

杜雨奇, 郑津, 王杨, 黄诚, 李平

《计算机应用》唯一官方网站 2022, 42 (12): 3692-3699. DOI: 10.11772/j.issn.1001-9081.2021101768

摘要（443）

HTML （24）

PDF （2746KB）（212）

文本分割的主要任务是将文本按照主题相关的原则划分为若干个相对独立的文本块。针对现有文本分割模型提取文本段落结构信息、语义相关性及上下文交互等细粒度特征的不足，提出了一种基于图卷积网络（GCN）的文本分割模型TS-GCN。首先，基于文本段落的结构信息与语义逻辑构建出文本图；然后，引入语义相似性注意力来捕获文本段落节点间的细粒度相关性，并借助GCN实现文本段落节点高阶邻域间的信息传递，以此增强模型多粒度提取文本段落主题特征表达的能力。将所提模型与目前常用作文本分割任务基准的代表模型CATS及其基础模型TLT-TS进行对比。实验结果表明在Wikicities数据集上，TS-GCN在未增加任何辅助模块的情况下比TLT-TS的评价指标P_k 值下降了0.08个百分点；在Wikielements数据集上，相较于CATS和TLT-TS，所提模型的P_k 值分别下降了0.38个百分点和2.30个百分点，可见TLT-TS取得了较好的分割效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于集成学习的口令强度评估模型

宋创创, 方勇, 黄诚, 刘亮

计算机应用 2018, 38 (5): 1383-1388. DOI: 10.11772/j.issn.1001-9081.2017102516

摘要（521）

PDF （850KB）（484）

针对现有的口令评估模型通用性差，没有一个可以对从简单口令到非常复杂口令都适用的评估模型的问题，设计了一种基于多模型的集成学习的口令评估模型。首先，使用真实的口令训练集训练多个现有的口令评估模型作为子模型；其次，将多个经过训练的子模型作为基学习器进行集成学习，采用偏弱项投票法的结合策略实现各个子模型的优势集成；最后，实现一个以高准确性为前提的通用口令评估模型。实验中使用网络泄露的真实用户口令数据集作为实验数据，实验结果表明，基于多模型集成学习模型针对不同复杂程度的口令进行口令强度评估，其评估结果准确率高、通用性强，所提模型在口令评估方面具有较好的适用性。

参考文献 | 相关文章 | 多维度评价

Select

4. 面向PHP应用程序的SQL注入行为检测

周颖, 方勇, 黄诚, 刘亮

计算机应用 2018, 38 (1): 201-206. DOI: 10.11772/j.issn.1001-9081.2017071692

摘要（723）

PDF （1074KB）（393）

层出不穷的SQL注入攻击使Web应用面临威胁。针对PHP应用程序中的SQL注入行为，提出了一种基于污点分析的SQL注入行为检测模型。首先，该模型使用PHP扩展技术在SQL函数执行时获取SQL语句，并记录攻击者所携带的身份信息；基于以上信息生成SQL请求日志，并将该日志作为分析源。然后，基于SQL语法和抽象语法树，实现了污点标记的SQL语法分析过程，并使用污点分析技术，提取语法树中SQL注入行为的多个特征。最后，使用随机森林分类算法实现SQL注入行为的判定。与正则匹配检测技术对比实验结果显示，通过该模型检测SQL注入行为，准确率为96.9%，准确率提高了7.2个百分点。该模型的信息获取模块能以扩展形式加载在任何PHP应用程序中，因此该模型可移植性强，在安全审计和攻击溯源中具有应用价值。

参考文献 | 相关文章 | 多维度评价